智能论文笔记

Impact of Acoustic Event Tagging on Scene Classification in a Multi-Task Learning Framework

Rahil Parikh , Harshavardhan Sundar , Ming Sun , Chao Wang , Spyros Matsoukas

分类：人工智能 | 机器学习

2022-06-27

声学事件是具有定义明确的光谱特征的声音，可以与生成它们的物理对象相关联。声学场景是没有特定时间顺序的此类声学事件的集合。鉴于事件和场景之间的这种自然联系，一个普遍的信念是，对事件进行分类的能力必须有助于对场景的分类。这导致了几项努力，试图在声学事件标签（AET）和声学场景分类（ASC）上做得很好，使用多任务网络。但是，在这些努力中，一项任务的改进不能保证另一个任务的改善，这表明ASC和AET之间会有张力。目前尚不清楚AET的改进是否转化为ASC的改进。我们通过一项广泛的实证研究来探索这一难题，并表明在某些条件下，使用AET作为多任务网络中的辅助任务始终提高ASC的性能。此外，ASC性能进一步改善了AET数据集大小，并且对事件的选择或AET数据集中的事件数量不敏感。我们得出的结论是，ASC性能的这种改善来自使用AET的正规化效果，而不是网络提高了在声学事件之间识别的能力。

translated by 谷歌翻译

Doubly Right Object Recognition: A Why Prompt for Visual Rationales

Chengzhi Mao , Revant Teotia , Amrutha Sundar , Sachit Menon , Junfeng Yang , Xin Wang , Carl Vondrick

分类：计算机视觉

2022-12-12

Many visual recognition models are evaluated only on their classification accuracy, a metric for which they obtain strong performance. In this paper, we investigate whether computer vision models can also provide correct rationales for their predictions. We propose a ``doubly right'' object recognition benchmark, where the metric requires the model to simultaneously produce both the right labels as well as the right rationales. We find that state-of-the-art visual models, such as CLIP, often provide incorrect rationales for their categorical predictions. However, by transferring the rationales from language models into visual representations through a tailored dataset, we show that we can learn a ``why prompt,'' which adapts large visual representations to produce correct rationales. Visualizations and empirical experiments show that our prompts significantly improve performance on doubly right object recognition, in addition to zero-shot transfer to unseen tasks and datasets.

translated by 谷歌翻译

Control Barrier Functions in UGVs for Kinematic Obstacle Avoidance: A Collision Cone Approach

Phani Thontepu , Bhavya Giri Goswami , Neelaksh Singh , Shyamsundar P I , Shyam Sundar M G , Suresh Sundaram , Vaibhav Katewa , Shishir Kolathaya.

分类：机器人

2022-09-23

在本文中，我们提出了针对无人接地车辆（UGV）的新的控制屏障功能（CBF），该功能有助于避免与运动学（非零速度）障碍物发生冲突。尽管当前的CBF形式已经成功地保证了与静态障碍物的安全/碰撞避免安全性，但动态案例的扩展已获得有限的成功。此外，借助UGV模型，例如Unicycle或自行车，现有CBF的应用在控制方面是保守的，即在某些情况下不可能进行转向/推力控制。从经典的碰撞锥中汲取灵感来避免轨迹规划，我们介绍了其新颖的CBF配方，并具有对独轮车和自行车模型的安全性保证。主要思想是确保障碍物的速度W.R.T.车辆总是指向车辆。因此，我们构建了一个约束，该约束确保速度向量始终避开指向车辆的向量锥。这种新控制方法的功效在哥白尼移动机器人上进行了实验验证。我们将其进一步扩展到以自行车模型的形式扩展到自动驾驶汽车，并在Carla模拟器中的各种情况下证明了避免碰撞。

translated by 谷歌翻译

Concentration inequalities for correlated network-valued processes with applications to community estimation and changepoint analysis

Sayak Chatterjee , Shirshendu Chatterjee , Soumendu Sundar Mukherjee , Anirban Nath , Sharmodeep Bhattacharyya

分类： (统计)机器学习

2022-08-02

网络值时间序列是目前的网络数据的常见形式。然而，研究由网络价值随机过程产生的网络序列的总体行为相对较少。现有的大多数研究都集中在简单的设置上，其中网络在整个时间内是独立的（或有条件独立的），并且所有边缘在每个时间步骤均同步更新。在本文中，我们研究了聚集的邻接矩阵的浓度特性以及与懒惰网络值随机过程产生的网络序列相关的相应拉普拉斯矩阵，其中边缘异步不断地更新，并且每个边缘都遵循其懒惰的随机过程，以更新独立于其更新其他边缘。我们证明了这些集中度的有用性，从而证明了标准估计器在社区估计和变更点估计问题中的一致性。我们还进行了一项仿真研究，以证明懒惰参数的影响，该参数控制时间相关的程度，对社区和变化点估计的准确性。

translated by 谷歌翻译

Data-Centric Epidemic Forecasting: A Survey

Alexander Rodríguez , Harshavardhan Kamarthi , Pulak Agarwal , Javen Ho , Mira Patel , Suchet Sapre , B. Aditya Prakash

分类：机器学习

2022-07-19

COVID-19的大流行提出了对多个领域决策者的流行预测的重要性，从公共卫生到整个经济。虽然预测流行进展经常被概念化为类似于天气预测，但是它具有一些关键的差异，并且仍然是一项非平凡的任务。疾病的传播受到人类行为，病原体动态，天气和环境条件的多种混杂因素的影响。由于政府公共卫生和资助机构的倡议，捕获以前无法观察到的方面的丰富数据来源的可用性增加了研究的兴趣。这尤其是在“以数据为中心”的解决方案上进行的一系列工作，这些解决方案通过利用非传统数据源以及AI和机器学习的最新创新来增强我们的预测能力的潜力。这项调查研究了各种数据驱动的方法论和实践进步，并介绍了一个概念框架来导航它们。首先，我们列举了与流行病预测相关的大量流行病学数据集和新的数据流，捕获了各种因素，例如有症状的在线调查，零售和商业，流动性，基因组学数据等。接下来，我们将讨论关注最近基于数据驱动的统计和深度学习方法的方法和建模范式，以及将机械模型知识域知识与统计方法的有效性和灵活性相结合的新型混合模型类别。我们还讨论了这些预测系统的现实部署中出现的经验和挑战，包括预测信息。最后，我们重点介绍了整个预测管道中发现的一些挑战和开放问题。

translated by 谷歌翻译

PROFHIT: Probabilistic Robust Forecasting for Hierarchical Time-series

Harshavardhan Kamarthi , Lingkai Kong , Alexander Rodríguez , Chao Zhang , B. Aditya Prakash

分类：机器学习 | 人工智能

2022-06-16

概率分层时间序列预测是时间序列预测的重要变体，其目标是建模和预测具有基本层次关系的多元时间序列。大多数方法都集中在点预测上，并且不提供良好的概率预测分布。最近的最先进的概率预测方法还对点预测和分布样本施加了层次关系，这并不能说明预测分布的相干性。先前的作品还默默地假设数据集始终与给定的层次关系一致，并且不适应显示出与此假设偏差的现实世界数据集。我们弥合了这两个差距，并提出了Profhit，这是一个完全概率的层次预测模型，共同模拟整个层次结构的预测分布。 Profhit使用一种灵活的概率贝叶斯方法，并引入了一种新颖的分布相干性正规化，以从层次关系中学习整个预测分布，以实现强大和校准的预测以及适应不同层次结构一致性的数据集。在评估广泛数据集的PROFHIT时，我们观察到准确性和校准的性能提高了41-88％。由于对完整分布的相干性进行了建模，我们观察到，即使缺少多达10％的输入时间序列数据，其他方法的性能严重降低70％以上，即使最多10％的输入时间序列数据也可以提供可靠的预测。

translated by 谷歌翻译

Self-Supervised Image-to-Text and Text-to-Image Synthesis

Anindya Sundar Das , Sriparna Saha

分类：计算机视觉 | 自然语言处理 | 机器学习

2021-12-09

全面了解视力和语言及其相互关系至关重要，以实现这些方式与学习更广泛，有意义的陈述之间的潜在的相似之处和差异。近年来，大多数与文本到图像综合和图像到文本生成有关的作品，专注于监督生成的深层架构来解决问题，在那里在学习嵌入空间之间的相似之处非常令人兴趣方式。在本文中，我们提出了一种新颖的自我监督基于深入的学习方法，了解了学习跨模式嵌入空间的基础方法;对于图片到文本和文本到映像生成。在我们的方法中，我们首先使用基于Stackgan的AutoEncoder模型获取图像的密集矢量表示，以及利用基于LSTM的文本 - autoEncoder的句子级的密集矢量表示;然后，我们研究映射到嵌入一个模态的空间，以利用GaN和最大平均差异的生成网络嵌入其他模态的空间。我们还证明我们的模型学会从图像数据以及来自定性和定量的文本数据的图像生成文本描述。

translated by 谷歌翻译

Changepoint Analysis of Topic Proportions in Temporal Text Data

Avinandan Bose , Soumendu Sundar Mukherjee

分类：自然语言处理 | 机器学习 | (统计)机器学习

2021-11-29

当分布生成数据变化时，ChangePoint分析处理时间序列数据中的时间点的无监督检测和/或估计。在本文中，我们在大规模文本数据的上下文中考虑\ emph {offline} ChangePoint检测。我们在主题比例分布的分布中构建了一个专门的时间主题模型。随着该模型的完全可能性推断是在计算上难以解决的，我们开发了一个计算易诊的近似推理过程。更具体地，我们使用样品分离来首先估计多个主题，然后将似然比统计与Fryzlewicz等人的野生二进制分割算法的修改版本一起应用。（2014）。我们的方法促进了大公司的结构变化的自动检测，而无需通过域专家手动处理。随着我们模型下的变换点对应于主题结构的变化，估计的变化点通常是高度可解释的，因为标志着时尚主题的普及涌现或下降。我们在两个大型数据集上应用我们的程序：（i）从1800-1922期（Underweet Al，2015年）的英语文学语料库; （ii）来自高能物理arxiv存储库的摘要（Clementet al。，2019）。我们获得一些历史上众所周知的改变点，发现一些新的变化点。

translated by 谷歌翻译

When in Doubt: Neural Non-Parametric Uncertainty Quantification for Epidemic Forecasting

Harshavardhan Kamarthi , Lingkai Kong , Alexander Rodríguez , Chao Zhang , B. Aditya Prakash

分类：机器学习 | 人工智能

2021-06-07

准确可靠的流行病预测是对公共卫生规划和疾病缓解影响的重要问题。大多数现有的疫情预测模型无视不确定性量化，导致错误校准的预测。近期神经模型的作品，用于不确定感知的时序预测也有几个限制;例如很难在贝叶斯NNS中指定有意义的前瞻，而Deep Leaseming的方法在实践中是计算昂贵的。在本文中，我们填补了这个重要的差距。我们将预测任务模拟为概率生成过程，并提出了一种名为EPIFNP的功能神经过程模型，其直接模拟预测值的概率密度。 EPIFNP利用动态随机相关图来模拟非参数方式之间序列之间的相关性，并设计不同的随机潜变量以捕获不同视角的功能不确定性。我们在实时流感预测环境中的广泛实验表明，EPIFNP在准确性和校准度量中显着优于先前的最先进模型，精度高达2.5倍，校准2.4倍。此外，由于其生成过程的性质，EPIFNP了解当前季节与历史季节类似模式之间的关系，从而实现可解释的预测。超越疫情预测，EPIFNP可以是独立的利益，以便在深度顺序模型中推进预测性分析的深度顺序模型

translated by 谷歌翻译

Deployable, Data-Driven Unmanned Vehicle Navigation System in GPS-Denied, Feature-Deficient Environments

Sohum Misra , Kaarthik Sundar , Rajnikant Sharma , Kevin Brink

分类：机器人

2021-01-24

本文提出了一种新型数据驱动导航系统，用于在GPS拒绝，特征缺陷的环境中导航无人驾驶车辆（UV），例如隧道或矿山。该方法利用车辆可以部署和测量范围从其使本地化作为车辆穿过隧道预定路径来实现的地标。在此类方案中出现的一个关键问题是估计和减少在使命开始之前需要部署的地标数量，以便在使命开始之前，给定有关环境的一些信息。主要焦点是保持所需值的最大位置不确定性。在本文中，我们通过组合来自估计，机器学习和混合整数凸优化的技术，在GPS拒绝的功能缺陷环境中开发一种新的车辆导航系统。本文开发了一种新颖，系统的方法，用于通过环境执行本地化并通过环境导航UV，同时保持所需的本地化精度。我们还对不同情景进行了广泛的模拟实验，这些实验证实了所提出的导航系统的有效性。

translated by 谷歌翻译